Automating and utilising equal-distribution data classification
نویسندگان
چکیده
Data classification, i.e. organising data items in groups (classes), is a general technique widely used visualisation and cartography, particular, for creation of choropleth maps. Conventionally, are classified by dividing the range into intervals assigning same symbol or colour to all falling within an interval. For instance, may be length include number items. We propose method defining so that some quantity represented values another attribute equally distributed among classes. This kind classification supports exploratory analysis relationships between distribution phenomenon whose additional attribute. The approach especially useful when very unequal, with many having zero low quantities quite few larger quantities. With such distribution, standard statistical problematic. demonstrate potential analysing referring set spatially people (patients) relationship characteristics areas which live.
منابع مشابه
the clustering and classification data mining techniques in insurance fraud detection:the case of iranian car insurance
با توجه به گسترش روز افزون تقلب در حوزه بیمه به خصوص در بخش بیمه اتومبیل و تبعات منفی آن برای شرکت های بیمه، به کارگیری روش های مناسب و کارآمد به منظور شناسایی و کشف تقلب در این حوزه امری ضروری است. درک الگوی موجود در داده های مربوط به مطالبات گزارش شده گذشته می تواند در کشف واقعی یا غیرواقعی بودن ادعای خسارت، مفید باشد. یکی از متداول ترین و پرکاربردترین راه های کشف الگوی داده ها استفاده از ر...
data mining rules and classification methods in insurance: the case of collision insurance
assigning premium to the insurance contract in iran mostly has based on some old rules have been authorized by government, in such a situation predicting premium by analyzing database and it’s characteristics will be definitely such a big mistake. therefore the most beneficial information one can gathered from these data is the amount of loss happens during one contract to predicting insurance ...
15 صفحه اولmodeling loss data by phase-type distribution
بیمه گران همیشه بابت خسارات بیمه نامه های تحت پوشش خود نگران بوده و روش هایی را جستجو می کنند که بتوانند داده های خسارات گذشته را با هدف اتخاذ یک تصمیم بهینه مدل بندی نمایند. در این پژوهش توزیع های فیزتایپ در مدل بندی داده های خسارات معرفی شده که شامل استنباط آماری مربوطه و استفاده از الگوریتم em در برآورد پارامترهای توزیع است. در پایان امکان استفاده از این توزیع در مدل بندی داده های گروه بندی ...
Automating Metadata Extraction: Genre Classification
A problem that frequently arises in the management and integration of scientific data is the lack of context and semantics that would link data encoded in disparate ways. To bridge the discrepancy, it often helps to mine scientific texts to aid the understanding of the database. Mining relevant text can be significantly aided by the availability of descriptive and semantic metadata. The Digital...
متن کاملUtilising Multiple Inductive Bias in Classification:
ii Chapter 1 " Every generalisation is dangerous, especially this one. " – Mark Twain
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: International journal of cartography
سال: 2021
ISSN: ['2372-9333', '2372-9341']
DOI: https://doi.org/10.1080/23729333.2020.1863000